ASSIGNMENT-VISUALIZATION
I.Tổng quan về dữ liệu
1.1. Nguồn gốc của bộ dữ liệu
Bộ dữ liệu “World Happiness” được lấy từ website https://worldhappiness.report/. Bộ dữ liệu về thang đo cuộc sống hạnh phúc thế giới là một tài nguyên quan trọng trong việc nghiên cứu và đánh giá sự phát triển của các quốc gia trên toàn cầu. Bộ dữ liệu này thường chứa thông tin về một loạt các chỉ số và yếu tố ảnh hưởng đến mức độ hạnh phúc và chất lượng cuộc sống của dân số, từ GDP bình quân đầu người, đến mức độ hỗ trợ xã hội và tự do cá nhân. Thông qua việc phân tích các dữ liệu này, nhà nghiên cứu có thể hiểu rõ hơn về mối quan hệ giữa các yếu tố kinh tế, xã hội, và tâm lý với sự hạnh phúc của con người. Đồng thời, bộ dữ liệu này cũng cho phép so sánh giữa các quốc gia để đo lường mức độ tiến bộ và đề xuất các chính sách để tăng cường hạnh phúc và phát triển bền vững trên toàn cầu.
Bộ dữ liệu chứa 1320 quan sát và 13 biến là các chỉ số hay yếu tố ảnh hưởng đến mức độ hạnh phúc của các nước trên thế giới
1.2. Tìm hiểu các biến
| Feature_Name | Type | Label_Description |
|---|---|---|
| Country | Character | Tên quốc gia |
| Continent | Factor | Lục địa (6 categories) |
| Income_Group | Factor | Nhóm thu nhập (4 categories) |
| Life_Ladder | Numeric | Mức độ hạnh phúc của quốc gia |
| Log_GDP_per_capita | Numeric | Logarit của GDP bình quân đầu người |
| Social_support | Numeric | Chỉ số hỗ trợ xã hội |
| Healthy_life_expectancy_at_birth | Numeric | Số năm trung bình sống khỏe mạnh |
| Freedom_to_make_life_choices | Numeric | Chỉ số tự do lựa chọn cuộc sống |
| Generosity | Numeric | Sự hào phóng |
| Perceptions_of_corruption | Numeric | Mức độ nhận thức về tham nhũng |
| Positive_affect | Numeric | Ảnh hưởng tích cực |
| Negative_affect | Numeric | Ảnh hưởng tiêu cực |
II. Thống kê mô tả
2.1. Xử lý outlier
Visual kiểm tra outlier
Sau khi xử lý outlier
2.2. Numeric variables
| Numeric_variables | Min | Mean | Median | Max | SD |
|---|---|---|---|---|---|
| Life_Ladder | 2.179 | 5.524 | 5.575 | 7.889 | 1.132 |
| Log_GDP_per_capita | 5.935 | 9.462 | 9.562 | 11.664 | 1.135 |
| Social_support | 0.502 | 0.8161 | 0.8355 | 0.9870 | 0.111 |
| Healthy_life_expectancy_at_birth | 48.80 | 64.41 | 65.7 | 79.52 | 6.169 |
| Freedom_to_make_life_choices | 0.447 | 0.7802 | 0.791 | 0.9850 | 0.117 |
| Generosity | -0.338 | -0.01139 | -0.025 | 0.374 | 0.140 |
| Perceptions_of_corruption | 0.424 | 0.7773 | 0.791 | 0.976 | 0.116 |
| Positive_affect | 0.352 | 0.6598 | 0.67 | 0.884 | 0.101 |
| Negative_affect | 0.0830 | 0.2789 | 0.271 | 0.512 | 0.084 |
2.3. Categorical variables
| Category | Count | Frequency |
|---|---|---|
| Region | ||
| Africa | 33 | 25% |
| Asia | 34 | 25.76% |
| Europe | 42 | 31.82% |
| South America | 10 | 7.58% |
| North America | 11 | 8.33% |
| Oceania | 2 | 1.52% |
| income_group | ||
| High | 41 | 31.06% |
| Upper_middle | 36 | 27.27% |
| Low | 21 | 15.91% |
| Lower_middle | 34 | 25.76% |
III. World Happiness Report từ 2013-2022
- Chỉ số Life Ladder trung bình giữa các châu lục có sự khác biệt. Châu Đại Dương cao nhất
- Chỉ số hạnh phúc của Châu Âu có tăng từ 2013-2021 và giảm trong năm 2022
- Ở khu vực Bắc Mĩ và Nam Mĩ có mức trung bình gần như nhau năm 2013, có sự đối lập trong năm 2015 đến cuối năm 2017 sau đó có xu hướng thay đổi khá tương đồng
- Trong khi đó, châu Á không biến động nhiều và trung bình Life Ladder ở châu Phi là thấp nhất
Biểu đồ Scatter thể hiện mối quan hệ giữa biến Log GDP per capita và Life Ladder trong thời gian 10 năm. Nhìn chung các nước thường có thu nhập cao thì sẽ có chỉ số hạnh phúc cao. Tuy nhiên xu hướng chung này vẫn có những điểm phá vỡ. Khi trực quan kĩ hơn ở từng châu lục, có thể thấy châu Phi mặc dù là một khu vực có nền kinh tế thấp, chỉ số Life Ladder cũng thấp nhất nhưng có 3 nước là Mauritius, Garbon, Botswana lại nằm trong nhóm thu nhập trung bình cao và nằm trên so với xu hướng của châu Phi. Ở cả 5 châu còn lại, sự biến động của Log GDP per capita không nhiều nhưng chỉ số Life Ladder lại biến động nhiều.
IV. World Happiness Report 2022
## NULL
- Chỉ số Life Ladder của các nước củ yếu nằm trong khoảng từ 4.5-7.
- Mức chỉ số Life Ladder phổ biến nhất dao dộng xung quanh khu vực 6 điểm. Có rất ít các nước nằm trong tình tình trạng kém hạnh phúc với số điểm từ 0-2. Không có quốc gia nào có chỉ số hài lòng với cuộc sống trên 8.
## 128 codes from your data successfully matched countries in the map
## 4 codes from your data failed to match with a country code in the map
## 115 codes from the map weren't represented in your data
4.1. Chỉ số Life Ladder giữa các quốc gia
Các nước có chỉ số Life Ladder cao hầu hết là các nước thuộc nhóm thu nhập cao trong khi các nước có chỉ số Life Ladder thấp là các nước thuộc nhóm thu nhập thấp hoặc trung bình thấp.
Tuy nhiên vẫn có nhiều nước thuộc nhóm thu nhập cao có chỉ số Life Ladder ở mức dưới 6.
4.2. Log_GDP_per_capita, Healthy_life_expectancy
4.2. Log_GDP_per_capita
4.2. Healthy_life_expectancy
4.3. Generosity
- Không phải tất cả các quốc gia có chỉ số Life Ladder cao đều có sự sẵn sàng quyên góp tiền của người dân cao, cũng như không phải tất cả các quốc gia có chỉ số Life Ladder thấp đều có sự sẵn sàng quyên góp tiền của người dân thấp.
- Đa số các quốc gia đều có chỉ số Generosity nằm trong khoảng từ -0.2 đến 0.2. Đa số các quốc gia có Life Ladder cao thì sẽ có chỉ số Generosity dương.
4.5. Positive affect and Negative affect
- Mỗi liên hệ giữa cảm xúc tích cực và cảm xúc tiêu cực có xu hướng ngược chiều nhau, khi một quốc gia có Positive_affect cao thì thường có Negative_affect thấp và ngược lại, mối liên hệ này không quá chặt chẽ vì các điểm trên biểu đồ phân tán rộng.
- Tuy nhiên các quốc gia có tỉ lệ người dân có các cảm xúc tích cực cao thì thường sẽ có chỉ số hài lòng với cuộc sống cao trong khi nếu người dân có nhiều cảm xúc tiêu cực thì chỉ số hạnh phúc sẽ thấp.
4.4. Social_support,Freedom and Perceptions_of_corruption